Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d’une exploitation textométrique : le cas des interrogatives partielles dans ESLO
نویسندگان
چکیده
Pour répondre aux problématiques engendrées par la diffusion de plus en massive des corpus linguistiques et à l’hétérogénéité leurs formats, nous proposons une méthode permettant prendre main langagiers oraux les convertir dans un format leur exploitation outillée. cette recherche, le ESLO sert d’exemple sa licence diffusion, son format, volume ses atouts sociolinguistiques diachroniques. Notre travail se fonde sur compilation ce pour rendre compatible avec l’outil textométrie TXM. Nous opérons ensemble transformations données l’utiliser au mieux. Enfin, illustrer apports ces avancées méthodologiques, analyse fine multidimensionnelle l’usage interrogatives ESLO.
منابع مشابه
Vers une Interface pour l'Enrichissement des Requêtes en Arabe dans un Système de Recherche d'Information
This presentation focuses on the automatic expansion of Arabic request using morphological analyzer and Arabic Wordnet. The expanded request is sent to Google.
متن کاملUn analyseur pré-syntaxique pour le levée des ambiguïtés dans des documents écrits en langue naturelle : application à l'indexation automatique
متن کامل
Définition de la sémantique des clés dans le web sémantique : un point de vue théorique
Résumé : De nombreuses approches ont été définies pour permettre le liage automatique de sources de données RDF publiées sur le Web. Certaines de ces approches sont basées sur la sélection des plus petits ensembles de propriétés pertinentes pour comparer deux données. Ces ensembles forment des clés et cette notion est similaire aux clés définies pour les bases de données relationnelles. Dans ce...
متن کاملRecherche d'information structurée. Vers un modèle possibiliste pour la recherche d'information dans des documents structurés
In this paper, we are interested in Information Retrieval in structured document in XML. For this, we present a model for the structured information retrieval, based on the possibilistic networks. The document elements and elements terms relations are modelled by measures of possibility and necessity. In this model, the user's request starts a process of propagation to recover the documents or ...
متن کاملExploitation des connaissances d'UMLS pour la recherche d'information médicale. Vers un modèle bayésien d'indexation
RÉSUMÉ. La recherche d’information à base de connaissances est largement étudiée, mais avec peu de succès. Dans cet article, nous étudions l’impact de l’exploration d’une base de connaissance, nommée méta thésaurus UMLS pour la recherche d’information médicale. D’abord, l’indexation par concepts d’UMLS extrait dans des textes ne montre qu’une légère amélioration de MAP(Mean Average Precision) p...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Corpus
سال: 2021
ISSN: ['1765-3126', '1638-9808']
DOI: https://doi.org/10.4000/corpus.5752